Exploración de los datos abiertos de COVID-19 México


Síguenos en nuestra página de Facebook "Análisis y visualización de datos"

https://www.facebook.com/An%C3%A1lisis-y-visualizaci%C3%B3n-de-datos-100602148375744/?ti=as

Introducción

La pandemia COVID-19 es uno de las peores situaciones que nos ha tocado vivir en México y en el mundo en los últimos años. Si bien, podemos obtener información acerca de la situación de esta pandemia en nuestro país en las conferencias emitidas diariamente, siempre quedan preguntas o nos surge algún interés en particular. Para esto, la Secretaría de Salud en su página de COVID publica los datos abiertos que utilizan para realizar algunos de los los análisis que muestran diario. El tener disponibles estos datos nos permite explorar más allá de lo que nos muestran, resolver nuestros propios intereses y tratar de estar mejor informados y cuestionarnos acerca de lo que los medios informan.

En esta ocasión, decidí trabajar en los los Datos Abiertos de COVID-19 para poder compartirlo con ustedes, presentando distintas visualizaciones que nos ayuden a entender como ha ido evolucionando la pandemia en el pais y mantenernos informados en algo que es de interés público. Al mismo tiempo, si tienen alguna duda, interés en explorar algo o comentarios acerca del análisis, me pueden dejar sus comentarios en nuestra página de Facebook "Análisis y visualización de datos". El análisis lo estoy actualizando periódicamente.

Cabe aclarar que en esta exploración de los datos de COVID19 no muestro modelos ni predicciones ya que no estoy especializado en cuestiones epidemiológicas.

En una vista rápida de los datos, con un formato más completo, podemos ver la siguente información:

FECHA_ACTUALIZACION ID_REGISTRO ORIGEN SECTOR ENTIDAD_UM SEXO ENTIDAD_NAC ENTIDAD_RES TIPO_PACIENTE FECHA_INGRESO ... OBESIDAD RENAL_CRONICA TABAQUISMO OTRO_CASO RESULTADO MIGRANTE PAIS_NACIONALIDAD PAIS_ORIGEN UCI MUNICIPIO
0 2020-08-25 0e05f1 2 ESTATAL 25 MUJER SINALOA SINALOA HOSPITALIZADO 2020-06-07 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO CULIACÁN
1 2020-08-25 06c278 2 IMSS 2 HOMBRE BAJA CALIFORNIA BAJA CALIFORNIA HOSPITALIZADO 2020-04-07 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO MEXICALI
2 2020-08-25 10eec7 2 IMSS 9 HOMBRE CIUDAD DE MEXICO CIUDAD DE MEXICO HOSPITALIZADO 2020-04-28 ... SI NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO AZCAPOTZALCO
3 2020-08-25 1dfc9e 2 ESTATAL 25 MUJER SINALOA SINALOA HOSPITALIZADO 2020-04-26 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO CULIACÁN
4 2020-08-25 13e374 2 IMSS 2 MUJER BAJA CALIFORNIA BAJA CALIFORNIA HOSPITALIZADO 2020-04-18 ... SI NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO TIJUANA

5 rows × 35 columns

Exploración de los datos

Los datos contienen a todos los sujetos que se han analizado hasta el momento (confirmados, negativos y pendientes).

El siguiente resultado contiene el número de sujetos(renglones) y el número de variables (columnas) presente:

(1278436, 35)

La tabla contiene las siguientes columnas las cuales pueden revisar para generar nuevas preguntas dependiendo de su interés.

Index(['FECHA_ACTUALIZACION', 'ID_REGISTRO', 'ORIGEN', 'SECTOR', 'ENTIDAD_UM',
       'SEXO', 'ENTIDAD_NAC', 'ENTIDAD_RES', 'TIPO_PACIENTE', 'FECHA_INGRESO',
       'FECHA_SINTOMAS', 'FECHA_DEF', 'INTUBADO', 'NEUMONIA', 'EDAD',
       'NACIONALIDAD', 'EMBARAZO', 'HABLA_LENGUA_INDIG', 'DIABETES', 'EPOC',
       'ASMA', 'INMUSUPR', 'HIPERTENSION', 'OTRA_COM', 'CARDIOVASCULAR',
       'OBESIDAD', 'RENAL_CRONICA', 'TABAQUISMO', 'OTRO_CASO', 'RESULTADO',
       'MIGRANTE', 'PAIS_NACIONALIDAD', 'PAIS_ORIGEN', 'UCI', 'MUNICIPIO'],
      dtype='object')

Antes de continuar, debemos aclarar algunas variables presentes en los datos que estan realacionadas con fechas:

  • FECHA_ACTUALIZACIÓN: Corresponde a la fecha de los datos publicados.
  • FECHA_INGRESO: Fecha en la que el paciente ingreso al hospital.
  • FECHA_SINTOMAS: Fecha en la que el paciente empezó con los síntomas.
  • FECHA_DEF: Presenta fecha sí el paciente desafortunadamente falleció.

Datos generales

A partir de la tabla anterior ocupamos la columna RESULTADO para contar a los sujetos con resultado a la prueba de COVID-19 positivos, negativos o pendientes.

Número de personas confirmadas con COVID-19: 568621
Número de personas con resultado negativo a COVID-19: 628937
Número de personas que esperan un resultado de la prueba de COVID-19: 80878
Número de fallecimientos con COVID-19 positivo: 61450
Número de sujetos analizados hasta el momento: 1278436

Algo que notamos en los datos es la presencia de sujetos que tienen una confirmación en la prueba de COVID-19, pero que su fecha de SINTOMAS fue antes de los primeros casos de COVID-19 en México (finales de Febrero).

En una conferencia se aclaró que estas incosistencias se deben a errores al momento de registrar los datos.

FECHA_ACTUALIZACION ID_REGISTRO ORIGEN SECTOR ENTIDAD_UM SEXO ENTIDAD_NAC ENTIDAD_RES TIPO_PACIENTE FECHA_INGRESO ... OBESIDAD RENAL_CRONICA TABAQUISMO OTRO_CASO RESULTADO MIGRANTE PAIS_NACIONALIDAD PAIS_ORIGEN UCI MUNICIPIO
2313 2020-08-25 135d2f 2 SSA 25 HOMBRE CIUDAD DE MEXICO HIDALGO AMBULATORIA 2020-02-27 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA PACHUCA DE SOTO
5057 2020-08-25 044a42 2 SSA 9 HOMBRE CIUDAD DE MEXICO CIUDAD DE MEXICO AMBULATORIA 2020-02-27 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA GUSTAVO A. MADERO
12015 2020-08-25 05f3d3 1 SSA 9 HOMBRE CIUDAD DE MEXICO CIUDAD DE MEXICO HOSPITALIZADO 2020-02-27 ... NO NO SI SI POSITIVO NO ESPECIFICADO México 99 SI IZTAPALAPA
37953 2020-08-25 189846 2 SSA 15 HOMBRE CIUDAD DE MEXICO MEXICO AMBULATORIA 2020-02-28 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA TLALNEPANTLA DE BAZ
62415 2020-08-25 17235f 2 IMSS 19 HOMBRE NUEVO LEON NUEVO LEON AMBULATORIA 2020-01-13 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO APLICA SAN NICOLÁS DE LOS GARZA
110190 2020-08-25 18ecd7 2 ISSSTE 9 HOMBRE CIUDAD DE MEXICO MEXICO HOSPITALIZADO 2020-04-01 ... NO NO NO NO POSITIVO NO ESPECIFICADO México 99 SI NEZAHUALCÓYOTL
126459 2020-08-25 1732a3 2 IMSS 2 MUJER BAJA CALIFORNIA BAJA CALIFORNIA HOSPITALIZADO 2020-04-14 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO TIJUANA
137961 2020-08-25 06e286 2 SSA 5 MUJER COAHUILA DE ZARAGOZA COAHUILA DE ZARAGOZA AMBULATORIA 2020-02-28 ... NO NO NO NO POSITIVO NO ESPECIFICADO México 99 NO APLICA TORREÓN
154141 2020-08-25 0aad01 2 SSA 7 MUJER CIUDAD DE MEXICO CHIAPAS AMBULATORIA 2020-02-29 ... NO NO NO SI POSITIVO NO ESPECIFICADO México 99 NO APLICA TUXTLA GUTIÉRREZ
190871 2020-08-25 04f68c 2 PRIVADA 15 HOMBRE NO ESPECIFICADO MEXICO HOSPITALIZADO 2020-03-04 ... NO NO NO NO POSITIVO NO ESPECIFICADO Italia 99 NO HUIXQUILUCAN
192965 2020-08-25 0f634f 1 IMSS 25 MUJER SINALOA SINALOA AMBULATORIA 2020-01-29 ... NO NO NO NO ESPECIFICADO POSITIVO NO ESPECIFICADO México 99 NO APLICA CULIACÁN
229778 2020-08-25 194f98 2 ISSSTE 9 HOMBRE CIUDAD DE MEXICO CIUDAD DE MEXICO HOSPITALIZADO 2020-02-27 ... NO NO NO NO POSITIVO NO ESPECIFICADO México 99 NO MIGUEL HIDALGO
624459 2020-08-25 178775 2 SSA 21 MUJER PUEBLA PUEBLA AMBULATORIA 2020-04-02 ... NO NO NO SI PENDIENTE NO ESPECIFICADO México 99 NO APLICA IZÚCAR DE MATAMOROS
625615 2020-08-25 003ca9 2 IMSS 22 HOMBRE QUERETARO QUERETARO AMBULATORIA 2020-02-07 ... NO NO NO NO ESPECIFICADO PENDIENTE NO ESPECIFICADO México 99 NO APLICA QUERÉTARO
626757 2020-08-25 12a243 2 SSA 9 MUJER CIUDAD DE MEXICO CIUDAD DE MEXICO AMBULATORIA 2020-02-24 ... NO NO NO NO PENDIENTE NO ESPECIFICADO México 99 NO APLICA TLALPAN
628889 2020-08-25 114288 2 IMSS 19 MUJER NUEVO LEON NUEVO LEON HOSPITALIZADO 2020-05-15 ... SI SI SI NO ESPECIFICADO PENDIENTE NO ESPECIFICADO México 99 NO LINARES
629072 2020-08-25 063f1e 2 IMSS 20 HOMBRE OAXACA OAXACA AMBULATORIA 2020-01-30 ... NO NO NO NO ESPECIFICADO PENDIENTE NO ESPECIFICADO México 99 NO APLICA NAZARENO ETLA
631921 2020-08-25 06cf4c 2 SSA 21 MUJER PUEBLA PUEBLA AMBULATORIA 2020-03-30 ... NO NO NO NO PENDIENTE NO ESPECIFICADO México 99 NO APLICA PUEBLA

18 rows × 35 columns

Como primera visualización podemos ver una gráfica de barras los valores NEGATIVOS, POSITIVOS y PENDIENTES por día.

Confirmados con COVID-19

La columna ENTIDAD_RES contiene la entidad en donde se encontraba el sujeto al momento de registrar sus datos.

Podemos agrupar los datos y presentarlos en una tabla con un gradiente para mostrar los Estados con mayor número de casos de COVID-19.

ENTIDAD TOTAL
0 CIUDAD DE MEXICO 92970
1 MEXICO 65128
2 GUANAJUATO 29324
3 VERACRUZ DE IGNACIO DE LA LLAVE 27385
4 TABASCO 27365
5 NUEVO LEON 27063
6 PUEBLA 25785
7 TAMAULIPAS 23429
8 SONORA 20915
9 COAHUILA DE ZARAGOZA 20257
10 JALISCO 18849
11 SAN LUIS POTOSI 16654
12 BAJA CALIFORNIA 16192
13 SINALOA 15558
14 GUERRERO 14273
15 MICHOACAN DE OCAMPO 14024
16 YUCATAN 13893
17 OAXACA 13090
18 QUINTANA ROO 9862
19 HIDALGO 9725
20 CHIHUAHUA 7358
21 BAJA CALIFORNIA SUR 7084
22 CHIAPAS 6202
23 TLAXCALA 6003
24 DURANGO 5972
25 QUERETARO 5723
26 CAMPECHE 5416
27 AGUASCALIENTES 5298
28 MORELOS 4991
29 ZACATECAS 4777
30 NAYARIT 4726
31 COLIMA 3330

O representarlo en una gráfica de barras.

También podemos agrupar los casos confirmados por día y su acumulado.

FECHA TOTAL TOTAL_ACCU
0 2020-01-13 00:00:00 1 1
1 2020-01-29 00:00:00 1 2
2 2020-02-06 00:00:00 1 3
3 2020-02-19 00:00:00 1 4
4 2020-02-21 00:00:00 1 5
5 2020-02-22 00:00:00 2 7
6 2020-02-23 00:00:00 1 8
7 2020-02-25 00:00:00 1 9
8 2020-02-26 00:00:00 1 10
9 2020-02-27 00:00:00 2 12
10 2020-02-28 00:00:00 2 14
11 2020-02-29 00:00:00 2 16
12 2020-03-01 00:00:00 6 22
13 2020-03-02 00:00:00 8 30
14 2020-03-03 00:00:00 6 36
15 2020-03-04 00:00:00 7 43
16 2020-03-05 00:00:00 7 50
17 2020-03-06 00:00:00 10 60
18 2020-03-07 00:00:00 21 81
19 2020-03-08 00:00:00 21 102
20 2020-03-09 00:00:00 64 166
21 2020-03-10 00:00:00 50 216
22 2020-03-11 00:00:00 51 267
23 2020-03-12 00:00:00 60 327
24 2020-03-13 00:00:00 88 415
25 2020-03-14 00:00:00 91 506
26 2020-03-15 00:00:00 100 606
27 2020-03-16 00:00:00 133 739
28 2020-03-17 00:00:00 111 850
29 2020-03-18 00:00:00 123 973
30 2020-03-19 00:00:00 113 1086
31 2020-03-20 00:00:00 183 1269
32 2020-03-21 00:00:00 131 1400
33 2020-03-22 00:00:00 141 1541
34 2020-03-23 00:00:00 222 1763
35 2020-03-24 00:00:00 182 1945
36 2020-03-25 00:00:00 211 2156
37 2020-03-26 00:00:00 249 2405
38 2020-03-27 00:00:00 289 2694
39 2020-03-28 00:00:00 276 2970
40 2020-03-29 00:00:00 266 3236
41 2020-03-30 00:00:00 387 3623
42 2020-03-31 00:00:00 310 3933
43 2020-04-01 00:00:00 466 4399
44 2020-04-02 00:00:00 440 4839
45 2020-04-03 00:00:00 445 5284
46 2020-04-04 00:00:00 454 5738
47 2020-04-05 00:00:00 434 6172
48 2020-04-06 00:00:00 587 6759
49 2020-04-07 00:00:00 517 7276
50 2020-04-08 00:00:00 630 7906
51 2020-04-09 00:00:00 634 8540
52 2020-04-10 00:00:00 969 9509
53 2020-04-11 00:00:00 733 10242
54 2020-04-12 00:00:00 780 11022
55 2020-04-13 00:00:00 974 11996
56 2020-04-14 00:00:00 917 12913
57 2020-04-15 00:00:00 1057 13970
58 2020-04-16 00:00:00 1040 15010
59 2020-04-17 00:00:00 1184 16194
60 2020-04-18 00:00:00 1278 17472
61 2020-04-19 00:00:00 1152 18624
62 2020-04-20 00:00:00 1875 20499
63 2020-04-21 00:00:00 1234 21733
64 2020-04-22 00:00:00 1270 23003
65 2020-04-23 00:00:00 1323 24326
66 2020-04-24 00:00:00 1570 25896
67 2020-04-25 00:00:00 1631 27527
68 2020-04-26 00:00:00 1456 28983
69 2020-04-27 00:00:00 1782 30765
70 2020-04-28 00:00:00 1569 32334
71 2020-04-29 00:00:00 1418 33752
72 2020-04-30 00:00:00 1971 35723
73 2020-05-01 00:00:00 2672 38395
74 2020-05-02 00:00:00 1927 40322
75 2020-05-03 00:00:00 1831 42153
76 2020-05-04 00:00:00 2332 44485
77 2020-05-05 00:00:00 2350 46835
78 2020-05-06 00:00:00 2110 48945
79 2020-05-07 00:00:00 2352 51297
80 2020-05-08 00:00:00 2719 54016
81 2020-05-09 00:00:00 2416 56432
82 2020-05-10 00:00:00 3254 59686
83 2020-05-11 00:00:00 3011 62697
84 2020-05-12 00:00:00 2719 65416
85 2020-05-13 00:00:00 2655 68071
86 2020-05-14 00:00:00 2670 70741
87 2020-05-15 00:00:00 3935 74676
88 2020-05-16 00:00:00 3003 77679
89 2020-05-17 00:00:00 2867 80546
90 2020-05-18 00:00:00 4126 84672
91 2020-05-19 00:00:00 3221 87893
92 2020-05-20 00:00:00 4396 92289
93 2020-05-21 00:00:00 3042 95331
94 2020-05-22 00:00:00 3848 99179
95 2020-05-23 00:00:00 3550 102729
96 2020-05-24 00:00:00 3335 106064
97 2020-05-25 00:00:00 5023 111087
98 2020-05-26 00:00:00 3678 114765
99 2020-05-27 00:00:00 3519 118284
100 2020-05-28 00:00:00 3996 122280
101 2020-05-29 00:00:00 4063 126343
102 2020-05-30 00:00:00 3908 130251
103 2020-05-31 00:00:00 3643 133894
104 2020-06-01 00:00:00 6610 140504
105 2020-06-02 00:00:00 4138 144642
106 2020-06-03 00:00:00 4095 148737
107 2020-06-04 00:00:00 4247 152984
108 2020-06-05 00:00:00 5245 158229
109 2020-06-06 00:00:00 4933 163162
110 2020-06-07 00:00:00 4186 167348
111 2020-06-08 00:00:00 5572 172920
112 2020-06-09 00:00:00 4523 177443
113 2020-06-10 00:00:00 6074 183517
114 2020-06-11 00:00:00 4408 187925
115 2020-06-12 00:00:00 5155 193080
116 2020-06-13 00:00:00 4595 197675
117 2020-06-14 00:00:00 4457 202132
118 2020-06-15 00:00:00 6854 208986
119 2020-06-16 00:00:00 5153 214139
120 2020-06-17 00:00:00 4457 218596
121 2020-06-18 00:00:00 5435 224031
122 2020-06-19 00:00:00 5547 229578
123 2020-06-20 00:00:00 7165 236743
124 2020-06-21 00:00:00 4579 241322
125 2020-06-22 00:00:00 5848 247170
126 2020-06-23 00:00:00 5083 252253
127 2020-06-24 00:00:00 5025 257278
128 2020-06-25 00:00:00 5986 263264
129 2020-06-26 00:00:00 6492 269756
130 2020-06-27 00:00:00 5087 274843
131 2020-06-28 00:00:00 6074 280917
132 2020-06-29 00:00:00 6437 287354
133 2020-06-30 00:00:00 6392 293746
134 2020-07-01 00:00:00 8105 301851
135 2020-07-02 00:00:00 5926 307777
136 2020-07-03 00:00:00 6367 314144
137 2020-07-04 00:00:00 5580 319724
138 2020-07-05 00:00:00 6097 325821
139 2020-07-06 00:00:00 6769 332590
140 2020-07-07 00:00:00 6141 338731
141 2020-07-08 00:00:00 5626 344357
142 2020-07-09 00:00:00 5732 350089
143 2020-07-10 00:00:00 8720 358809
144 2020-07-11 00:00:00 5609 364418
145 2020-07-12 00:00:00 5924 370342
146 2020-07-13 00:00:00 7152 377494
147 2020-07-14 00:00:00 5963 383457
148 2020-07-15 00:00:00 7514 390971
149 2020-07-16 00:00:00 5964 396935
150 2020-07-17 00:00:00 6702 403637
151 2020-07-18 00:00:00 6659 410296
152 2020-07-19 00:00:00 5896 416192
153 2020-07-20 00:00:00 9181 425373
154 2020-07-21 00:00:00 5559 430932
155 2020-07-22 00:00:00 5524 436456
156 2020-07-23 00:00:00 5387 441843
157 2020-07-24 00:00:00 5882 447725
158 2020-07-25 00:00:00 6816 454541
159 2020-07-26 00:00:00 5132 459673
160 2020-07-27 00:00:00 6616 466289
161 2020-07-28 00:00:00 5451 471740
162 2020-07-29 00:00:00 4651 476391
163 2020-07-30 00:00:00 4779 481170
164 2020-07-31 00:00:00 5009 486179
165 2020-08-01 00:00:00 7367 493546
166 2020-08-02 00:00:00 4814 498360
167 2020-08-03 00:00:00 5712 504072
168 2020-08-04 00:00:00 4444 508516
169 2020-08-05 00:00:00 5076 513592
170 2020-08-06 00:00:00 4299 517891
171 2020-08-07 00:00:00 4756 522647
172 2020-08-08 00:00:00 4901 527548
173 2020-08-09 00:00:00 4026 531574
174 2020-08-10 00:00:00 6386 537960
175 2020-08-11 00:00:00 4034 541994
176 2020-08-12 00:00:00 3902 545896
177 2020-08-13 00:00:00 3700 549596
178 2020-08-14 00:00:00 3998 553594
179 2020-08-15 00:00:00 3919 557513
180 2020-08-16 00:00:00 2834 560347
181 2020-08-17 00:00:00 2951 563298
182 2020-08-18 00:00:00 2268 565566
183 2020-08-19 00:00:00 1376 566942
184 2020-08-20 00:00:00 968 567910
185 2020-08-21 00:00:00 454 568364
186 2020-08-22 00:00:00 155 568519
187 2020-08-23 00:00:00 77 568596
188 2020-08-24 00:00:00 25 568621

No solo podemos revisar los casos confirmados también ver el número de fallecimientos por día y su acumulado.

Antes de las visualizaciones observamos otra inconsistencia en sujetos que tienen registrada una fecha de defunción pero antes de que se registrará la fecha de los sintomas o personas con fecha de fallecimiento antes de los primeros casos de COVID-19 en México.

Comó se menciono anteriormente, esto puede ser por un error al registrar los datos.

FECHA_ACTUALIZACION ID_REGISTRO ORIGEN SECTOR ENTIDAD_UM SEXO ENTIDAD_NAC ENTIDAD_RES TIPO_PACIENTE FECHA_INGRESO FECHA_SINTOMAS FECHA_DEF INTUBADO NEUMONIA
361352 2020-08-25 14ca54 2 IMSS 11 HOMBRE GUANAJUATO GUANAJUATO HOSPITALIZADO 2020-02-11 2020-02-11 2020-03-01 SI SI
623686 2020-08-25 1731ab 1 IMSS 9 MUJER MEXICO CIUDAD DE MEXICO HOSPITALIZADO 2020-05-24 2020-05-24 2020-04-13 NO SI
1178404 2020-08-25 009132 1 IMSS 27 HOMBRE TABASCO TABASCO HOSPITALIZADO 2020-07-29 2020-07-29 2020-06-29 NO SI
1215394 2020-08-25 1c2b09 2 IMSS 11 HOMBRE GUANAJUATO GUANAJUATO HOSPITALIZADO 2020-07-26 2020-07-26 2020-06-27 NO SI

Una manera de visualizar los datos de confirmados y fallecimientos es mediante un gráfico de área ya que en este caso los fallecimientos contados son un grupo de los sujetos confirmados y podemos comparar su proporción.

O gráficar con barras para cada día.

Preguntas que podemos explorar

Utilizando los datos de los casos confirmados, ¿Cuántos ingresaron en hospitales?

Para esto ocupamos la columna TIPO_PACIENTE que contiene valores como Hospitalizado que significa que esta o estuvo presente en un Hospital y Ambulatoria que significa que fue confirmado con COVID-19 pero que no ingreso a un hospital.

Seleccionando a los sujetos confirmados con COVID-19 y que se ingresaron en algún hospital, ¿Cuántos fueron entubados?

Para responder esto ocupamos la columna INTUBADO en la que se señala si el sujeto tuvo que ser intubado como un signo de la complicación de la enfermedad.

TIPO_PACIENTE SEXO CONTEOS
0 AMBULATORIA HOMBRE 209662
1 AMBULATORIA MUJER 212460
2 HOSPITALIZADO HOMBRE 89448
3 HOSPITALIZADO MUJER 57051

Podemos ocupar un gráfico de box plot para saber la distribución de la edad de las personas confirmadas que se encontraron en el hospital.

Podemos crear rangos de edad y observar que grupo es el que ha presentado más casos que requieran hospitalización.

En México siempre se ha mantenido las "noticias" acerca de que los hospitales se encuentran llenos y hemos visto las conferencias acerca de la expansión en hospitales dependendiendo de la situación que se encuentran los Estados. Lamentablemente, con los datos que estamos trabajando en este momento no hay información de esta capacidad en hospitales pero si podemos visualizar el número de personas que se encontraron en los distintos tipos de hospitales.

Commorbilidades

Otro problema que existe en México son las enfermedades que complican la condición del paciente con COVID-19. Entre las más importantes se encuentran Obesidad, Diabetes e Hipertensión. Observando los datos registrados hasta 2016, México presenta un crecimiento en el porcentaje de adultos con obesidad cada año. La siguente gráfica muestra el porcentaje en distintos paises desde 1975 al 2016, incluyendo Mexico.

Ahora en relación con COVID-19, podemos ver el número de personas confirmadas, saber si presentan obesidad y su condición en el hospital.

La misma situación pero con las otras dos cormobilidades, Diabetes e hipertension que estan estrechamente relacionadas con la Obesidad.

Siguiendo el interés de las co-morbilidades podemos clasificar cada paciente con el número de las enfermades que se mencionaron anteriormente ya que son las que presentaron y presentan un mayor riesgo.

Hasta el momento, solo hemos explorado los datos de las personas confirmadas con COVID-19 desde el inicio de la pandemia en México, no las personas que actualmente presentan la enfermedad.

Usando el número de personas confirmadas con COVID19 y con la población total de cada Estado (datos de 2017) podemos determinar el número total de fallecimientos en cada Estado por cada 100 000 habitantes.

O la otra manera que podemos ver los lamentables fallecimientos es por el total de confirmados de COVID-19 en cada Estado. No es la forma más adecuada de ver estos datos, ya que como han explicado, depende mucho del número de pruebas que se hacen. Por lo que muchas pruebas solo reduciría la proporción de fallecimientos por total de confirmados. Pero puede ser útil para ver algúna localidad en la que la proporcion de falleciemientos aumente y tratar de determinar las posibles causas.

Otra manera de ver la relación entre el número de fallecimientos y el número de confirmados mediante un gráfico denominado scatterplot en el que cada punto representa una entidad Federativa.

El siguiente gráfico muestra los casos confirmados en cada Estado desde el inicio de la pandemia en México hasta el día de hoy.

Ya que los datos presentan tanto el Estado como el minicipio podemos realizar un gráfico denominado treemap que nos permite observar los casos totales por localidad y el tamaño de los cuadros es por número correspondiente.

En el caso de los Recuperados, según los informes de la Secretaría de Salud, son los casos después de 15 días al inicio de los síntomas.

Si seleccionamos los casos confirmados de las últimas dos semanas tendríamos los casos que se consideran activos ya que se toma en cuenta que la enfermedad tiene una duración promedio de 14 días. Puede ser que esta restricción no contemple todos los activos ya que pueden existir casos en los que la recuperación sea lenta sin embargo, una alta proporcion de los casos activos se encuentran con el criterio tomado.

Podemos ocupar estos casos activos para generar un treemap.

Casos Por día

Una manera de poder ver el número de casos nuevos por dia es usando un heatmap en que podemos ver el crecimiento de casos por cada 100K personas del Estado. Para poder apreciar mejor el número de casos se calcula el logaritmo base 10. La idea original de esta visualización la puedes encontrar en el siguente artículo:

https://towardsdatascience.com/visualization-of-covid-19-new-cases-over-time-in-python-8c6ac4620c88

Duración epidémica

También es posible explorar la duración de la epidemia COVID19 en cada uno de los Estados. Esto quiere decir tomar el registro de cuando se dio el primer caso confirmado de COVID19 en cada uno de los Estados y continuar el lapso hasta el último día en el que se registro una confirmació. De esta manera podremos ver si algún Estado ha dejado de tener casos.

Debido a los errores al momento de registrar los datos, como se mencionó anteriormente, se tomarán en cuenta solo los datos a partir de inicios de Marzo 2020 que fue de las fechas oficiales.

Teniendo en cuenta este último gráfico, podemos revisar por día como fueron los distintos casos (no acumulados).

El siguente calendario muestra la intensidad de los casos confirmados en todo México por día. Es necesario considerar que debido a los errores de anotación que se describieron anteriormente el calendario iniciaria en Enero y Febrero cuando no en realidad no fue asi. Sin embargo, no se eliminaron ya que cuentan como casos postivos.

También es posible revisar los casos recuperados y observarlos en un calendario.

Y por último los fallecimientos por día.